统计研究 ›› 2021, Vol. 38 ›› Issue (5): 109-120.doi: 10.19343/j.cnki.11-1302 /c.2021.05.009
白永昕 田茂再
Bai Yongxin Tian Maozai
摘要: 本文研究了响应变量和协变量均为函数型数据的非线性可加模型的变量选择问题。 首先,基于函数型距离相关系数,本文构造了一个F检验统计量 对协变量和残差的函数型距离相关系数进行排序并对最大相关系数所对应的协变量与残差进行独立性 F 检验,选择满足条件的新变量纳入到模型。其次,对每个新变量纳入模型后的贡献进行评估,从而确认新变量最终是否应该纳入模型。 这种变量选择方法通过不依赖模型的方法选择候选变量,将变量选择和模型估计分开,可以降低回归中协变量的维度。同时,在迭代过程中利用残差可以获取模型的相关信息,从而提高变量选择的准确度。最?后,本文通过模拟研究对所提变量选择方法的表现进行评价,并进一步通过一个家电能耗数据来验证所提的方法。